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摘要 : 微生物 组 学 是 新 兴学 科 ,与 肠 道 .代谢 ,生殖 ,神经 等 大 量 慢性 疾病 相关 。 通 过 测序 分 析 微 生物 组 ,主要 包括 16S rRNA 和 
宏基 因 组 两 大 技术 。16S rRNA 数 据 分 析 主 要 包括 序列 处 理 样品 多 样 性 分 析 及 统计 分 析 3 个 步骤 。 宏 基因 组 数据 分 析 主 要 包 


括 序列 处 理 分类、 注释 及 统计 分 析 4 个 环节 。 随 着 测序 技术 的 升级 ,测序 成 本 将 逐步 降低 ,而 大 数据 分 析 将 成 为 核心 内 容 。 数 


据 的 标准 化 和 可 积累 性 、 通 过 数据 建 模 和 预测 疾病 的 发 生发 展 是 未 来 应 用 的 基础 ,数据 知识 产权 保护 以 及 数据 本 身价 值 的 开发 


与 保护 价值 将 日 益 显现 ,培养 和 基于 培养 的 功能 验证 将 是 未 来 的 重点 之 一 。 人 体 微生物 组 学 将 阐述 并 调整 人 与 微生物 组 之 间 


的 关系 ,此 领域 相关 研究 有 巨大 的 发 展 空间 。 
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Methods, challenges and opportunities for big data analyses of microbiome 
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Abstract: Microbiome is a novel research field related with a variety of chronic inflamatory diseases. Technically, there are two 
major approaches to analysis of microbiome: metataxonome by sequencing the 16S rRNA variable tags, and metagenome by 
shot-gun sequencing of the total microbial (mainly bacterial) genome mixture. The 16S rRNA sequencing analyses pipeline 
includes sequence quality control, diversity analyses, taxonomy and statistics; metagenome analyses further includes gene 
annotation and functional analyses. With the development of the sequencing techniques, the cost of sequencing will decrease, 
and big data analyses will become the central task. Data standardization, accumulation, modeling and disease prediction are 


crucial for future exploit of these data. Meanwhile, the information property in these data, and the functional verification with 
culture-dependent and culture-independent experiments remain the focus in future research. Studies of human microbiome 
will bring a better understanding of the relations between the human body and the microbiome, especially in the context of 
disease diagnosis and therapy, which promise rich research opportunities. 
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“微生物 群落 "是 地 球 上 生命 基本 元 素 (CN 和 8 
等 ) 进 行 生物 地 球 化 学 循环 的 主要 驱动 力 ,与 人 类 健康 、 
环境 保护 以 及 工农 业 生产 等 密切 相关 。 近 十 年 来 , 随 着 
高 通 量 测 序 的 广泛 应 用 ， 微 生物 组 学 "成 为 新 兴 概 念 和 
热点 。 微 生物 组 与 不 同 的 生存 环境 结合 ,诞生 人 体 微 生 
物 组 ,宿主 相关 微生物 组 ,一般 环境 微生物 组 ,建筑 环境 
微生物 组 ,地 球 微生物 组 ,医院 环境 微生物 组 等 大 量 新 
兴 的 研究 方向 。 

长 期 以 来 ,人 研究 方法 一 直 是 微生物 群落 研究 的 瓶 


颈 。 如 ,群落 结构 的 阐述 , 即 准确 描述 一 定 空 间 范 围 内 
的 物种 数量 ,并 定量 各 物种 的 丰 度 ,这 是 所 有 生态 学 研 
究 的 基本 内 容 。 然 而 ,对 微生物 研究 者 而 言 ,实现 这 一 
基本 要 求 却 绝 非 易 事 。 这 种 困难 主要 源 于 微生物 群落 
的 如 下 几 点 特征 。 

(1)“ 微 小 ”: 宏 观 生物 可 以 肉眼 或 者 镜 下 观察 其 形 
态 学 分 类 特征 并 计数 ;而 微生物 即便 在 显微镜 下 也 难以 
区 分 ,形态 差异 特征 少 ,因而 不 能 直接 观察 种 属 并 计数 。 

(2) 复杂 ” :微生物 很 少 以 纯 种 存在 ;但 微生物 群落 
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含有 极 高 的 多 样 性 。1 g 土 壤 中 可 能 含有 数 千 到 数 万 个 
不 同 种 属 的 微生物 。 

(3 六 稠密 " :1 g 土 壤 ,1 滴 流水 ,都 可 能 含有 数 以 十 
亿 计 的 微生物 ,并且 它 们 常常 来 自 成 千 上 万 的 种 属 。 

(4) “不 均 ”: 不 同 种 属 微生物 在 群落 中 的 丰 度 差异 
极 大 。 这 种 不 均匀 的 分 布 特征 造成 优势 种 非 优势 种 以 
及 稀有 种 的 计数 难以 同时 进行 。 

面 对 如 此 庞大 复杂 的 微生物 生态 系统 ,微生物 组 学 
要 准确 理解 样品 中 的 微生物 种 类 ,多 度 及 其 功能 ,并 将 
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其 与 时 间 \ 空 间 \、 理 化 因素 ,宿主 疾病 状态 等 进行 关联 ， 
从 而 探求 微生物 与 微生物 之 间 ,微生物 与 宿主 之 间 , 以 
及 微生物 与 环境 之 间 的 相互 关系 。 因 此 ,需要 恰当 的 技 
术 , 在 广度 和 精度 这 两 个 略 显 矛 盾 的 角度 ,同时 获得 理 
想 的 数据 。 

自 2006 年 , 随 着 新 一 代 高 通 量 测序 技术 的 成 熟 ,不 
仅 在 人 类 基因 组 学 领域 带 来 了 翻天 窗 地 的 变化 ,对 微 生 
物 组 学 的 研究 产生 了 革命 性 的 影响 。 当 前 ,以 16S 
IRNA 高 通 量 测序 为 基本 手段 ,宏基 因 组 鸟 枪法 测序 安 
转录 组 宏和 蛋白 组 ` 宏 代谢 组 等 组 学 领域 产生 了 大 量 的 
新 技术 ,共同 促进 了 微生物 组 学 的 快速 进步 。 


1 微生物 组 大 数据 分 析 的 方法 和 流程 

16S 的 测序 是 近年 来 微生物 生态 领域 最 核心 .最 重 
大 的 突破 。 通 过 454 Illumina 等 第 2 代 测 序 仪 高 通 量 测 
定 16S 可 变 区 序列 ,第 1 次 让 人 们 在 可 行 的 成 本 下 ,获得 
全 面 、 系 统 结构 化 的 群落 结构 信息 "”。 美 国 Woods 
Hole 海 洋 研 究 实验 室 的 Mitchell Sogin 课题 组 于 2006 
年 首次 报道 了 通过 焦 磷酸 测序 技术 ,测定 海洋 沉积 物 样 
品 的 16S rRNA 基 因 V6 可 变 区 ,人 类 第 1 次 在 基本 足够 
的 测序 深度 下 ,清晰 地 展示 了 环境 样品 中 微生物 的 组 
成 ,发 现 了 高 度 的 多 样 性 。 

与 所 有 传统 的 微生物 组 学 研究 方法 相 比 ,该 方法 具 
有 显著 的 优越 性 。 该 方法 通过 测定 16S 短 片段 序列 ,经 
生物 信息 学 分 析 可 以 获得 系统 分 类 信息 ,从 而 可 以 明确 
定性 其 分 类 单元 ,不 同 实验 间 数 据 完 全 是 可 比较 .可 积 
累 的 。 该 方法 通 量 显著 提高 ,1 次 测定 40~100 万 条 序 
列 , 通 过 条 码 技术 可 以 对 每 个 样品 测定 数 千 到 数 万 条 短 
序列 ,从 而 可 以 获得 广泛 的 、 系 统 的 结构 信息 。 由 于 测 
序 深度 大 ,在 多 个 数量 级 范围 内 可 以 进行 定量 。 该 方法 
的 诞生 对 微生物 组 学 的 研究 产生 了 巨大 的 影响 ,尤其 对 
人 体 共 生 微生物 领域 最 为 活跃 。 例 如 ,肥胖 与 部 分 肠 道 
菌 群 间 的 相关 性 研究 ;人 体 不 同 部 位 的 菌 群 结构 的 首 
次 阐明 后; 抗生素 对 肠 道 微生物 群落 产生 的 显著 影响 
等 。 在 环境 中 ,该 技术 首次 在 海洋 沉积 物 中 发 现存 在 极 
其 丰富 .多样 化 的 微生物 群落 。 该 方法 让 人 们 得 以 比较 
大 空间 尺度 下 土壤 微生物 群落 结构 的 差异 及 其 主要 的 
影响 因素 (如 pH)“*。 

基于 16S 的 分 析 可 称 为 宏 分 类 组 技术 
(metataxonome)。16S 的 数据 分 析 , 其 一 般 流 程 包括 : 
序列 提取 、 质 控 ` 相 似 序列 聚 类 成 OTU ,种 属 分 类 ,alpha 
以 及 beta 多 样 性 分 析 , 以 及 进一步 的 统计 分 析 。 其 中 每 
一 步 都 有 关键 之 处 ,并 正 处 于 方法 学 前 沿 领域 。 

OTU 聚 类 是 16S 序 列 分 析 的 关键 问题 之 一 。 在 经 
典 的 分 层 聚 类 算法 中 ,其 运算 量 和 所 需 的 内 存 容量 , 均 
随 着 序列 数量 的 增加 呈 几 合 级 数 增加 。 因 此 , 贪 禁 算 法 


成 为 目前 该 领域 的 主流 。 同 时 ,也 有 不 少 研究 者 开发 不 
基于 序列 比 对 的 聚 类 算法 。 但 是 ,由 于 序列 相似 性 算法 
的 不 同 , 聚 类 中 距离 的 传递 问题 ,以 及 参考 序列 数据 库 
的 不 足 ,该 领域 仍然 存在 运算 效率 和 准确 性 问题 。 目 
前 , 与 参 比 库 比 对 的 Open-reference 算法 "以 及 
UPARSE 是 运用 较为 广泛 的 技术 。 

在 完成 聚 类 后 ,种 属 的 分 类 仍然 存在 许多 问题 。 目 
前 ,该 领域 主要 通过 与 16S 数据 库 比 对 ,选取 相似 性 高 
的 参 比 序列 的 分 类 结果 。 但 是 , 参 比 数据 库 本 身 , 目 前 
存在 不 少 问题 ,例如 目前 应 用 最 为 广泛 的 Greengenes 
数据 库 " ,其 中 不 少 序列 存在 重复 或 者 错误 的 分 类 结果 。 

UniFrac 距离 的 计算 ,是 beta 多 样 性 分 析 的 关键 工 
具 。UniFrac 距 离 是 美国 科 罗 达 罗 大 学 Rob Knight 课 
题 组 创建 的 一 种 基于 序列 之 间 相 似 度 ,计算 样品 之 间 总 
的 菌 群 中 离 的 算法 ,有 加 权 和 不 加 权 两 种 ,在 分 析 微 生 
物 群 落 相似 性 中 均 具 有 重要 作用 "。 基 于 UniFrac 的 工 
作 基 础 ,Rob Knight 课题 组 进一步 开发 了 微生物 群落 以 
及 微生物 生态 分 析 的 主流 工具 体系 Quantitiative 
Insight Into the Microbial Ecology(QIIME)。 该 平台 是 
一 个 流程 的 整合 ,已 经 在 全 球 分 析 微 生物 组 学 科 中 广泛 
应 用 ”。 

与 之 对 应 ,Patrick Schloss 开 发 了 Mothur ,该 平 
台 基 于 最 初 的 序列 聚 类 工具 DOTUR 而 来 。 该 平台 和 
QIME 竞 争 , 在 许多 地 方 有 相似 之 处 。 二 者 之 间 的 区 别 
是 ,QIIME 更 为 开放 ,系统 整合 能 力 更 强 , 尊 重 方法 的 原 
创 者 ,应 用 者 更 多 一 些 ,而 Mothur 则 全 部 经 作者 改写 ， 
相对 封闭 。 核 糖 体 数 据 库 RDP database 课 题 组 ,也 同样 
开发 了 针对 二 代 测 序数 据 的 群落 分 析 工 具 ”“。 除 此 之 
外 ,MG-RAST 是 一 个 综合 性 的 在 线 数据 分 析 平 台 "。 
使 用 者 只 需要 将 自己 的 测序 数据 投递 到 该 网 站 , 即 可 点 
击 不 同 的 宏基 因 组 分 析 命 令 , 完 成 数据 分 析 。 欧 洲 
MetaHIT 以 及 其 它 小 组 也 开发 了 一 些微 生物 群落 的 分 
析 工 具 , 但 应 用 面 不 及 上 述 几 个 平台 。 

需要 指出 的 是 ,除了 16S 外 ,人 们 还 开发 了 一 些 针 
对 特定 功能 基因 的 靶 向 测序 技术 ,从 而 检测 其 功能 多 样 
性 。 其 分 析 流 程 大 体 与 16$ 相似 ,但 需要 特定 的 数据 库 
加 以 比 对 分 析 ”“。 

宏基 因 组 技术 (metagenome) ,又 称 为 元 基因 组 技 
术 , 是 在 16S 分 析 的 基础 上 ,通过 宏基 因 组 的 鸟 枪法 高 
通 量 测序 ,能 够 同时 获得 菌 群 的 分 类 信息 以 及 功能 基因 
的 数据 。 并 且 该 技术 未 经 PCR 扩 增 ,因此 PCR 导致 的 
偏差 较 少 (测序 建 库 时 还 会 有 部 分 PCR 的 影响 )。 因 为 
微生物 群落 中 不 同 微生物 的 多 度 差异 极 大 ,和 欲 获得 足够 
的 定量 信息 ,需要 测试 大 量 的 数据 。 根 据 不 同 的 需求 ， 
单个 样品 宏基 因 组 测序 的 数据 量 , 在 Giga 以 上 1~2 个 数 
量 级 水 平 。 如 此 巨大 的 数据 量 , 无 论 是 测试 成 本 ,还 是 
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分 析 所 需要 消耗 的 机 时 ,都 相当 可 观 。 因 此 ,人 们 通常 
在 16S 测 试 的 基础 上 ,挑选 少量 目标 样品 ,测试 其 全 基 
因 组 。 当 前 ,宏基 因 组 数据 的 分 析 , 通 党 包括 如 下 步骤 : 
序列 质 控 ;将 获得 的 高 质 序 列 组 装 (或 者 不 经 组 装 ,直接 
与 参 比 数据 库 比 对 ); 将 组 装 后 的 序列 与 现 有 的 微生物 
基因 数据 比 对 ,并 将 比 对 上 的 序列 进行 门 纲 、 目 、 科 、 
属 . 种 的 分 类 和 让 度 统计 ;进行 样品 间 物 种 多 样 性 的 比 
较 , 如 PCA 分 析 、 聚 类 分 析 、 和 饰 选 与 样品 分 组 显著 相关 
因子 ;进行 基因 组 份 分析 , 如 前 噬菌体 预测 .可 转 坐 原 
件 . 基 因 预 测 ; 通 过 与 KEGG CAZy ,eggNOG 数 据 库 比 
对 进行 功能 注释 ,分 析 其 中 的 代谢 通路 ,碳水 化 合 物 活 
性 酶 . 同 源 性 ;抗生素 耐 药 组 的 比 对 分 析 等 。 在 宏基 因 
组 分 析 中 ,针对 病毒 单独 纯化 的 序列 测序 ,可 以 获得 病 
毒 组 数据 ,对 微生物 生态 的 解析 ,提供 了 全 新 的 视野 。 
宏基 因 组 测序 和 16S 测 序 尽管 在 菌 群 分 布 上 基本 是 一 
致 的 中 ,但 分 辨 效率 显著 不 同 。 例 如 ,在 群落 层面 ,二 型 
糖尿 病 患 者 肠 道 菌 群 和 对 照 人 群 并 无 显著 的 不 同 ,但 
是 ,在 宏基 因 组 揭示 的 功能 基因 上 ,两 组 却 呈 现 显著 的 
差异 “”"。 尽 管 宏基 因 组 技术 非常 强大 ,该 技术 仍然 存 
在 诸多 技术 瓶颈 。 其 一 ,大 量 序列 目 前 尚 无 法 找到 匹配 
的 数据 库 序 列 , 尤 其 是 病毒 ,大 约 80% 甚 至 更 多 的 序列 
无 法 注释 ;其 二 ,仅仅 通过 序列 相似 度 ,对 功能 的 注释 党 
篆 是 不 准确 的 ,存在 大 量 的 误 注 释 ; 最 后 ,对 于 大 量 的 微 
生物 基因 组 ,通过 宏基 因 组 难以 将 其 进行 组 装 拼 接 , 尤 
其 是 对 低 丰 度 的 菌株 。 其 中 前 两 点 缺陷 同样 适用 于 宏 
转录 组 学 。 


2 微生物 组 大 数据 分 析 的 发 展 趋势 
2.1 数据 通 量 的 进一步 提高 ,成 本 的 进一步 下 降 

随 着 测序 .质谱 等 技术 的 不 断 进步 ,依赖 于 上 述 技 
术 的 微生物 组 分 析 技 术 将 同样 不 断 升级 换代 。 伴 随 着 
上 述 发 展 ,解释 微生物 组 所 需要 的 数据 量 将 不 再 成 为 瓶 
有 贷 。 多 组 学 联合 应 用 ,将 日 益 成 为 微生物 组 大 数据 分 析 
的 常用 工具 。 
2.2 大 数据 分 析 成 为 领域 的 竞争 焦点 

当前 ,数据 产生 的 效率 ,已 经 远 远 高 于 分 析 效 率 的 
提升 。 微 生物 组 各 类 大 数据 的 综合 分 析 ,日 益 成 为 瓶 
有 颈 。 如 何 储存 ,如 何 积 累 ,如 何 提 取 关 键 信息 ,如 何 可 视 
化 展示 ,如 何 保证 数据 本 身 以 及 分 析 的 可 重 现 性 ,这 一 
切 都 成 为 数据 分 析 的 挑战 。 同 时 ,基于 宏基 因 组 数据 的 
网 络 化 分 析 和 展示 ,是 数据 分 析 的 新 兴 方 向 。 
2.3 如 何 促 进 数据 的 标准 化 和 可 积累 性 日 益 显 现 

该 问题 初 看 不 是 科学 问题 ,但 却 是 限制 我 国 相关 学 
科 发 展 的 重要 之 处 。 如 此 庞大 的 数据 量 , 如 同 迷 宫 一 般 
的 分 析 流 程 ,不 断 升级 的 分 析 工 具 , 许 多 原 有 的 分 析 在 
不 断 纠 错 , 这 些 数据 的 获得 都 来 之 不 易 , 如 何 标准 化 ,如 


何 让 后 来 者 可 以 使 用 数据 ,这 些 对 于 微生物 组 学 科学 问 
题 的 解答 至 关 重 要 。 例 如 ,我 们 发 现 ,经 典 聚 类 算法 直 
接 导 致 了 OTU 的 不 稳定 性 ,从 而 导致 随 着 测序 深度 的 
变化 ,OTU 的 组 成 成 员 不 断 发 生 改变 ,进而 影响 到 多 
样 性 的 评估 和 差异 物种 的 寻找 ,而 该 错误 在 大 量 的 经 典 
文献 中 都 有 所 体现 人 站。 有 人 研究 者 正在 探讨 ,运用 
iPython notebook 工具 ,将 原始 数据 的 分 析 流 程 加 以 保 
存 ,从 而 重 现 全 部 的 分 析 过 程 。 
2.4 模型 和 预测 是 未 来 发 展 的 趋势 

随 着 数据 量 的 日 益 增 加 ,建立 微生物 生态 模型 ,并 
预测 微生物 群落 的 动态 发 展 ,预测 相关 的 生物 学 效应 ， 
是 微生物 组 学 研究 的 重要 方向 和 关键 应 用 。 
2.5 数据 知识 产权 保护 以 及 数据 本 身价 值 的 开发 与 保护 

伴随 着 微生物 组 学 大 数据 的 不 断 发 展 ,一 个 现实 的 
问题 是 ,分 析 工 具 网 站 以 及 数据 储存 网 站 , 越 来 越 倾 向 
于 要 求 使 用 者 将 原始 数据 以 及 研究 相关 的 详细 
meta-data 上 传 。 这 一 方面 使 得 数据 的 积累 更 加 可 靠 。 
但 同时 ,这 种 要 求 使 得 拥有 数据 库 .掌握 数据 分 析 方 法 
的 团队 ,能 够 比 实验 者 本 身 更 早 掌 握 研 究 的 全 面 信息 。 
这 种 大 数据 挖掘 能 力 , 令 实验 团队 面临 一 定 的 知识 产权 
损失 风险 。 
2.6 培养 和 基于 培养 的 功能 验证 将 成 为 新 的 瓶颈 需求 

随 着 非 培养 技术 提供 越 来 越 多 的 数据 ,如 何 验证 基 
于 大 数据 分 析 提 出 的 假设 ,如 何 应 用 非 培 养 提取 出 的 重 
要 菌株 ,这 一 切 都 需要 获得 纯 培 养 菌株 ,在 原 位 和 实验 
室 条 件 下 验证 其 功能 。 


3 人 体 微 生物 组 学 发 展 趋势 

尽管 微生物 组 学 呈现 爆炸 式 发 展 趋势 ,该 学 科 尚 处 
在 早期 阶段 ,存在 巨大 的 发 展 空间 。 作 为 人 体 生物 医学 
研究 的 最 后 一 块 处 女 地 (我 们 不 能 排除 未 来 在 核酸 研究 
等 领域 存在 新 发 现 的 可 能 ) ,整个 领域 正 处 于 从 现象 描 
述 ,关联 分 析 , 到 机 制 研究 ,模型 干预 ,最 终 到 疾病 诊断 、 
预测 和 治疗 的 井喷 式 发 展 中 。 

随 着 数据 的 积累 ,人 们 将 日 益 理 解 在 复杂 的 人 
体 微生物 生态 背后 ,哪些 微生物 是 疾病 或 健康 的 驱 
动 者 ,哪些 是 沉默 者 。 基 于 此 ,我 们 将 能 理解 何 为 正 
常 菌 群 , 何 为 失调 阔 群 。 人 体 微生物 组 在 后 天 是 如 
何 形 成 ,发展 、 稳 定 , 以 及 与 人 体 相互 作用 。 从 生态 
学 角度 ,人 体 微生物 组 在 不 同 部 位 形成 以 及 改变 的 
驱动 因子 是 什么 ? 

在 应 用 角度 ,目前 有 两 个 重要 的 发 展 方向 。 其 一 ， 
运用 人 体 微生物 组 的 组 成 或 者 功能 基因 ,预测 特定 疾病 
的 发 生 .发展 以 及 结局 。 过 去 十 多 年 ,人 们 在 运用 人 体 
基因 组 表达 谱 以 及 差异 基因 预测 疾病 和 治疗 效果 上 取 
得 了 长 足 的 进步 ;可 以 预期 ,在 未 来 的 十 年 内 ,人 们 可 以 
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在 微生物 组 上 做 出 相似 的 工作 。 例 如 ,人 们 发 现 IBD 患 
者 与 非 患者 之 间 的 菌 群 存在 显著 差异 ,可 以 将 其 作为 非 
介入 式 疾病 诊断 的 方法 之 一 路 。 通 过 对 人 体 微生物 组 
的 干预 和 调整 ,治疗 和 预防 疾病 3。 与 人 体 本 身 的 基 
因 组 不 同 , 人 体 微生物 组 是 可 以 改变 的 。 人 们 可 以 通过 
罕 普 抗生素 .益生 元 药物 .饮食 调整 等 策略 ,改善 人 体 
微生物 生态 。 在 此 类 研究 中 ,宿主 的 选择 性 .生命 早期 
事件 `. 地 区 差异 , 肠 道 病 毒 组 .人 体 微 生物 组 之 间 的 传 
递 ,以 及 人 体 微 生物 资源 开发 利用 等 ,都 存在 大 量 的 微 
生物 生态 学 问题 有 竺 研究。 我 国 传统 医学 在 人 体 微 生 
物 生态 方向 积累 了 大 量 的 经 验 ,诸如 祛 湿 、 补 脾 健 胃 等 
都 可 能 与 人 体 菌 群 有 关 。 如 何 通过 现代 人 体 微生物 生 
态 学 手段 ,将 传统 经 验 进 一 步 提 取 ,澄清 其 背后 的 机 制 ， 
开发 药品 和 保健 食品 ,保护 好 传统 的 知识 产权 ,是 我 国 
相关 科研 人 员 的 机 遇 与 责任 。 

微生物 组 学 研究 ,目的 为 回答 谁 ,做 什么 ,和 怎么 做 
三 大 基本 问题 。 如 果 说 过 去 方法 学 是 核心 瓶颈 ,如 今 条 
件 则 已 基本 具备 。 回 答 谁 ,人 们 可 以 采用 16S 和 宏基 因 
组 测序 ,高 通 量 培 养 ,基因 芯片 , 痰 光 原 位 杂交 等 技术 。 
回答 做 什么 ,人 们 可 以 采用 宏 转 录 组 ,宏和 蛋白 组 , 宏 代谢 
组 ,基因 芯片 ,同位 素 标 记 , 单 细胞 测序 等 手段 。 回 答 怎 
么 做 , 则 可 以 通过 上 述 多 组 学 与 环境 因子 的 关联 数据 挖 
气 , 通 过 移植 实验 (例如 无 菌 鼠 验证 肠 道 菌 群 的 功能 ) 等 
手段 来 解决 。 随 着 上 述 工具 的 建立 ,微生物 组 这 一 黑 盒 
子 正在 打开 。 尺 管 高 通 量 方法 的 成 本 依然 偏 高 ,但 随 着 
新 工具 的 不 断 开发 ,微生物 组 分 析 的 效率 和 准确 性 都 将 
不 断 提高 。 如 何 利 用 好 这 些 工 具 , 关 注 微 生物 生态 问 
题 ,而 不 是 局 限于 追求 一 个 完美 的 技术 ,值得 国内 研究 
者 的 重视 。 
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